Ứng dụng Chiều_VC

Chiều VC được sử dụng rộng rãi trong lý thuyết học thống kê. Nó cho một chặn trên của xác suất sai của mô hình phân loại.

Nếu dữ liệu kiểm tra được chọn độc lập, cùng phân bố như nhau và như dữ liệu luyện tập, thì lỗi kiểm tra là không quá

lỗi luyện tập + h ( log ⁡ ( 2 N / h ) + 1 ) − log ⁡ ( η / 4 ) N {\displaystyle +{\sqrt {h(\log(2N/h)+1)-\log(\eta /4) \over N}}}

với xác suất 1 − η {\displaystyle 1-\eta } , trong đó h {\displaystyle h} là chiều VC của mô hình phân loại và N {\displaystyle N} là kích thước dữ liệu vào (công thức này chỉ đúng khi h ≪ N {\displaystyle h\ll N} ). Có thể tìm ra chặn trên tương tự bằng độ phức tạp Rademacher, nhưng độ phức tạp Rademacher đôi khi cung cấp cái nhìn sâu sắc hơn chiều VC về các phương pháp thống kê, chẳng hạn như những phương pháp sử dụng hàm hạt nhân.

Trong hình học tính toán, chiều VC là một tham số quan trọng của kích thước lưới ε. Kích thước này quyết định tốc độ nhiều thuật toán cũng như độ chính xác của nhiều thuật toán xấp xỉ.